在本文中,我们考虑了找到一种元学习在线控制算法的问题,该算法可以在面对$ n $(类似)控制任务的序列时可以在整个任务中学习。每个任务都涉及控制$ t $时间步骤的有限视野的线性动力系统。在采取控制动作之前,每个时间步骤的成本函数和系统噪声是对抗性的,并且控制器未知。元学习是一种广泛的方法,其目标是为任何新的未见任务开出在线政策,从其他任务中利用信息以及任务之间的相似性。我们为控制设置提出了一种元学习的在线控制算法,并通过\ textit {meta-regret}表征其性能,这是整个任务的平均累积后悔。我们表明,当任务数量足够大时,我们提出的方法实现了与独立学习的在线控制算法相比,$ d/d/d^{*} $较小的元regret,该算法不会在整个网上控制算法上进行学习任务,其中$ d $是一个问题常数,$ d^{*} $是标量,随着任务之间的相似性的增加而降低。因此,当任务的顺序相似时,提议的元学习在线控制的遗憾显着低于没有元学习的幼稚方法。我们还提出了实验结果,以证明我们的元学习算法获得的出色性能。
translated by 谷歌翻译
混合精确的深神经网络达到了硬件部署所需的能源效率和吞吐量,尤其是在资源有限的情况下,而无需牺牲准确性。但是,不容易找到保留精度的最佳每层钻头精度,尤其是在创建巨大搜索空间的大量模型,数据集和量化技术中。为了解决这一困难,最近出现了一系列文献,并且已经提出了一些实现有希望的准确性结果的框架。在本文中,我们首先总结了文献中通常使用的量化技术。然后,我们对混合精液框架进行了彻底的调查,该调查是根据其优化技术进行分类的,例如增强学习和量化技术,例如确定性舍入。此外,讨论了每个框架的优势和缺点,我们在其中呈现并列。我们最终为未来的混合精液框架提供了指南。
translated by 谷歌翻译
我们解决了通过在线后退地平线控制(RHC)的框架来控制控制未知线性动态系统的问题,以时代变化的成本函数。我们考虑控制算法不知道真正的系统模型的设置,并且只能访问固定长度(不与控制范围内的增长)预览未来成本函数。我们使用动态遗憾度量的算法表征了算法的性能,该算法被定义为算法产生的累积成本与后视行动中最佳动作顺序之间的差异。我们提出了两个不同的在线RHC算法来解决这个问题,即确定的等价RHC(CE-RHC)算法和乐观RHC(O-RHC)算法。我们表明,在模型估计的标准稳定假设下,CE-RHC算法实现$ \ Mathcal {O}(T ^ {2/3})$动态遗憾。然后,我们将此结果扩展到通过提出O-RHC算法仅适用于真实系统模型的稳定假设。我们表明O-RHC算法实现$ \ Mathcal {O}(T ^ {2/3})$动态遗憾,但有一些额外的计算。
translated by 谷歌翻译
在自动车辆(AVS)中,预警系统依赖于碰撞预测,以确保乘员安全。然而,使用深度卷积网络的最先进的方法在建模冲突中失败或者太昂贵/慢,使它们不太适合在AV边缘硬件上部署。为了解决这些限制,我们提出了SG2VEC,一种使用图形神经网络(GNN)和长短期内存(LSTM)层的时空场景图嵌入方法,以通过视觉场景感知来预测未来的碰撞。我们展示SG2VEC预测碰撞8.11%,比综合数据集的最新方法提前39.07%,在挑战现实世界碰撞数据集中更准确地进行29.47%。我们还表明,SG2VEC在将知识从合成数据集转移到现实世界驾驶数据集时更好。最后,我们证明SG2VEC更快地执行推论9.3X,较小的型号为88.0%,功率少32.4%,而且能量少于行业标准的NVIDIA驱动PX 2平台,制作它更适合在边缘实施。
translated by 谷歌翻译
Deep learning techniques with neural networks have been used effectively in computational fluid dynamics (CFD) to obtain solutions to nonlinear differential equations. This paper presents a physics-informed neural network (PINN) approach to solve the Blasius function. This method eliminates the process of changing the non-linear differential equation to an initial value problem. Also, it tackles the convergence issue arising in the conventional series solution. It is seen that this method produces results that are at par with the numerical and conventional methods. The solution is extended to the negative axis to show that PINNs capture the singularity of the function at $\eta=-5.69$
translated by 谷歌翻译
我们解决了监视一组二进制随机过程的问题,并在其中的异常数超过阈值时生成警报。为此,决策者选择并探测过程的子集以获得其状态的噪声估计(正常或异常)。根据所接收的观察,决策者首先确定是否声明异常数已超过阈值或继续观察。当决定继续时,它会决定是否在下次即时收集观察,或者将其推迟到以后的时间。如果它选择收集观察,它进一步确定了待探测的过程的子集。为了设计这三步的顺序决策过程,我们使用贝叶斯制剂,其中我们学习了过程的状态的后验概率。使用后验概率,我们构建了马尔可夫决策过程,并利用深刻的演员批评加强学习解决了它。通过数值实验,我们展示了与传统的基于模型的算法相比的算法的卓越性能。
translated by 谷歌翻译
在本文中,我们提出了一种用于图像剪接检测的新型社会启发卷积神经网络(CNN)深度学习模型。基于从检测到粗略拼接图像区域的前提是可以改善视觉上不可察觉的剪接图像锻炼的检测,所提出的模型称为MissMarple,是涉及特征转移学习的双CNN网络。通过培训和测试所提出的模型,使用哥伦比亚剪接,WildWeb,DSO1和拟议数据集的培训和测试所提出的模型,标题为Abhas,由现实的剪接锻炼组成,揭示了现有深度学习模型的检测精度的提高。
translated by 谷歌翻译
我们解决了从给定集中选择和观察过程的问题,以找到其中的异常。决策者在任何给定的时间瞬间观察过程的子集,并获得相应过程是否异常的嘈杂二进制指示符。在该设置中,我们开发了一种异常检测算法,该检测算法选择在给定的时间瞬间观察的过程,决定何时停止观察,并宣布对异常过程的决定。检测算法的目的是识别具有超过所需值的精度的异常,同时最小化决策制定的延迟。我们设计了一种集中式算法,其中通过公共代理和分散算法共同选择进程,其中对于每个过程独立决定是否选择过程。我们的算法依赖于使用每个过程的边际概率定义的马尔可夫决策过程正常或异常,调节观察结果。我们利用深度演员批评加强学习框架实现了检测算法。与在此主题的事先工作不同,在流程数量中具有指数复杂性,我们的算法具有在过程数量中的多项式的计算和内存要求。我们通过将它们与最先进的方法进行比较来证明这些算法使用数值实验的功效。
translated by 谷歌翻译
每当一个人听到污染的时候,比不是不是,他们思想的第一个想法是空气污染。全球最介绍和讨论的污染之一是我们水体中不可生物降解的废物引起的。在印度的情况下,河流和湖泊表面有很多塑料废物。 Ganga River是10家河流之一,占90%的塑料,最终在大海中,由于这种废物,湖泊有主要的纳拉纳斯和湖泊的主要案例。这限制了清洁水源,导致水源的主要耗尽。从2001年到2012年,在海德拉巴市,3245公顷的湖泊消散了。在新德里南部的平均水平,水将九英尺抬起。因此,清洁这些本地水体和河流至关重要。我们的宗旨是开发一种水面清洁机床,该机床部署在岸上。机器人将在途中检测垃圾斑块并收集垃圾,从而使水体清洁。该解决方案采用监测机制,以便在发现任何人被发现污染水体时提醒当局。开发了一种通过使用太阳能来为系统供电的可持续系统。计算机视觉算法用于检测水面上的垃圾。该垃圾由机器人收集,并在指定位置处置。除了清洁水体外,还借助虚拟击剑算法实施了预防措施,如果有人试图污染水处理,则会提醒当局。部署Web应用程序和移动应用程序以分别检查机器人和岸上监控的运动。这种完整的解决方案涉及水护理所需的预防性和治疗措施。
translated by 谷歌翻译
尽管当前的视觉算法在许多具有挑战性的任务上都表现出色,但尚不清楚他们如何理解现实世界环境的物理动态。在这里,我们介绍了Physion,一种数据集和基准,用于严格评估预测物理场景如何随着时间而发展的能力。我们的数据集具有对各种物理现象的现实模拟,包括刚性和软体体碰撞,稳定的多对象配置,滚动,滑动和弹丸运动,因此比以前的基准提供了更全面的挑战。我们使用Physion来基准一套模型,其体系结构,学习目标,投入输出结构和培训数据各不相同。同时,我们在同一场景上获得了人类预测行为的精确测量,从而使我们能够直接评估任何模型能够近似人类行为的效果。我们发现,学习以对象为中心的表示的视觉算法通常优于那些没有人的表现,但仍未达到人类绩效。另一方面,绘制具有直接访问物理状态信息的神经网络的表现效果更好,并且做出与人类制作的预测更相似。这些结果表明,提取场景的物理表征是在视力算法中实现人类水平和类似人类的物理理解的主要瓶颈。我们已公开发布了所有数据和代码,以促进使用物理以完全可重现的方式对其他模型进行基准测试,从而使对视觉算法的进度进行系统的评估,这些算法像人们一样坚固地了解物理环境。
translated by 谷歌翻译